FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6269, 255 aa
1>>>pF1KE6269 255 - 255 aa - 255 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.9542+/-0.000831; mu= 16.5819+/- 0.050
mean_var=63.3565+/-12.707, 0's: 0 Z-trim(107.2): 30 B-trim: 0 in 0/50
Lambda= 0.161131
statistics sampled from 9402 (9424) to 9402 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.289), width: 16
Scan time: 1.510
The best scores are: opt bits E(32554)
CCDS10626.1 AQP8 gene_id:343|Hs108|chr16 ( 261) 1713 406.6 8.7e-114
CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 ( 265) 448 112.5 2.9e-25
CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 ( 271) 420 106.0 2.7e-23
CCDS8919.1 MIP gene_id:4284|Hs108|chr12 ( 263) 396 100.4 1.3e-21
CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 ( 301) 395 100.2 1.7e-21
CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 ( 323) 395 100.3 1.8e-21
CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 ( 282) 373 95.1 5.5e-20
CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 ( 269) 346 88.8 4.1e-18
>>CCDS10626.1 AQP8 gene_id:343|Hs108|chr16 (261 aa)
initn: 1713 init1: 1713 opt: 1713 Z-score: 2156.3 bits: 406.6 E(32554): 8.7e-114
Smith-Waterman score: 1713; 100.0% identity (100.0% similar) in 255 aa overlap (1-255:7-261)
10 20 30 40 50
pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIENG
::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MSGEIAMCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIENG
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 TDTGLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TDTGLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE6 GMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEK
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE6 TKGPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAGLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TKGPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAGLL
190 200 210 220 230 240
240 250
pF1KE6 VGLLIRCFIGDGKTRLILKAR
:::::::::::::::::::::
CCDS10 VGLLIRCFIGDGKTRLILKAR
250 260
>>CCDS8793.1 AQP5 gene_id:362|Hs108|chr12 (265 aa)
initn: 441 init1: 197 opt: 448 Z-score: 566.9 bits: 112.5 E(32554): 2.9e-25
Smith-Waterman score: 448; 37.7% identity (72.1% similar) in 215 aa overlap (28-238:10-220)
10 20 30 40 50
pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIENGTDTG-L
:.. ..:.:.. .:.:.: :... . .
CCDS87 MKKEVCSVAFLKAVFAEFLATLIFVFFGLGSALKWPSALPTI
10 20 30 40
60 70 80 90 100 110
pF1KE6 LQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGG-LNLVMLLPYWVSQLLGGMLG
:: ::: :::.: . .:: .::::.:::..:: .:.:. ..:. . : ..::.:.. :
CCDS87 LQIALAFGLAIGTLAQALGPVSGGHINPAITLA-LLVGNQISLLRAFFYVAAQLVGAIAG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE6 AALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEKTKGP
:.. .:.: . : . :. . ::: :.:.:.::: ::: . .. ...:.
CCDS87 AGILYGVAPLNARGNLAVNALNNNTTQGQ---AMVVELILTFQLALCIFASTDSRRTSPV
110 120 130 140 150
180 190 200 210 220 230
pF1KE6 LAP-FSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWN-FHWIYWLGPLLAGLLVG
.: .:::..::. :.: .: :::::.:::::: :... ::..:.::.....:..
CCDS87 GSPALSIGLSVTLGHLVGIYFTGCSMNPARSFGPAVVMNRFSPAHWVFWVGPIVGAVLAA
160 170 180 190 200 210
240 250
pF1KE6 LLIRCFIGDGKTRLILKAR
.:
CCDS87 ILYFYLLFPNSLSLSERVAIIKGTYEPDEDWEEQREERKKTMELTTR
220 230 240 250 260
>>CCDS8792.1 AQP2 gene_id:359|Hs108|chr12 (271 aa)
initn: 353 init1: 187 opt: 420 Z-score: 531.6 bits: 106.0 E(32554): 2.7e-23
Smith-Waterman score: 420; 35.5% identity (68.4% similar) in 228 aa overlap (24-243:2-222)
10 20 30 40 50
pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYER---FVQPCLVELLGSALFIFIGCLSVIE-NGTD
: : : . ..:.:.. ::.:.: :... .
CCDS87 MWELRSIAFSRAVFAEFLATLLFVFFGLGSALNWPQAL
10 20 30
60 70 80 90 100 110
pF1KE6 TGLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVS-QLLGG
..:: :.: ::..: .. .::.:::.:.::::..: :.: :. ..:. ::::.
CCDS87 PSVLQIAMAFGLGIGTLVQALGHISGAHINPAVTVAC-LVGCHVSVLRAAFYVAAQLLGA
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE6 MLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEKT
. :::: . ..: . . . :. . :: :...:..:: : :..:. : ...
CCDS87 VAGAALLHEITPADIRGDLAVNALSNSTTAGQ---AVTVELFLT--LQLVLCIFASTDER
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE6 KG--PLAP-FSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAG
.: : .: .::::.:.. : : .: :::::...::::..... ::..:.:::. :
CCDS87 RGENPGTPALSIGFSVALGHLLGIHYTGCSMNPARSLAPAVVTGKFDDHWVFWIGPLV-G
160 170 180 190 200 210
240 250
pF1KE6 LLVGLLIRCFIGDGKTRLILKAR
..: :. ..
CCDS87 AILGSLLYNYVLFPPAKSLSERLAVLKGLEPDTDWEEREVRRRQSVELHSPQSLPRGTKA
220 230 240 250 260 270
>>CCDS8919.1 MIP gene_id:4284|Hs108|chr12 (263 aa)
initn: 354 init1: 185 opt: 396 Z-score: 501.7 bits: 100.4 E(32554): 1.3e-21
Smith-Waterman score: 396; 33.3% identity (68.9% similar) in 222 aa overlap (24-238:2-218)
10 20 30 40 50
pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYER---FVQPCLVELLGSALFIFIGCLSVIENGTDT
: : : . ..:.... ...:.: : .. .
CCDS89 MWELRSASFWRAIFAEFFATLFYVFFGLGSSLRWAPGP
10 20 30
60 70 80 90 100 110
pF1KE6 -GLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLGGM
.:: :.: ::::. .. ..:.:::.: ::::..: .. . ..:. . : ..::::..
CCDS89 LHVLQVAMAFGLALATLVQSVGHISGAHVNPAVTFAFLVGSQMSLLRAFCYMAAQLLGAV
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE6 LGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAI-NEKT
:::. .:.: : :. :.. .:. : ..::.:: : ...:. : .:.
CCDS89 AGAAVLYSVTPPAVRGN---LALNTLHPAVSVGQATTVEIFLT--LQFVLCIFATYDERR
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE6 KGPLAP--FSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAGL
.: :. ...::.... : : .:. :::::.:.::....... ::.::.::...:
CCDS89 NGQLGSVALAVGFSLALGHLFGMYYTGAGMNPARSFAPAILTGNFTNHWVYWVGPIIGGG
160 170 180 190 200 210
240 250
pF1KE6 LVGLLIRCFIGDGKTRLILKAR
: .::
CCDS89 LGSLLYDFLLFPRLKSISERLSVLKGAKPDVSNGQPEVTGEPVELNTQAL
220 230 240 250 260
>>CCDS58617.1 AQP4 gene_id:361|Hs108|chr18 (301 aa)
initn: 383 init1: 211 opt: 395 Z-score: 499.6 bits: 100.2 E(32554): 1.7e-21
Smith-Waterman score: 395; 33.6% identity (68.2% similar) in 223 aa overlap (24-238:8-225)
10 20 30 40 50
pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIE-NGTDTGL
: . : . .:.:. .:.... :.:. .::. :
CCDS58 MVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWGGTEKPL
10 20 30 40
60 70 80 90 100 110
pF1KE6 LQPALAHGLALGLVIATL----GNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLGG
. .: .:: :::. :.:::::.::::..: . .... . : ..: ::.
CCDS58 PVDMVLISLCFGLSIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIAAQCLGA
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE6 MLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAG-ALVAEIILTTLLALAVCMGAINEK
..::.. :.: .. :. ::. . . .:: .:..:.:.: :.... . ...
CCDS58 IIGAGILYLVTPP----SVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFASCDSKR
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE6 TK--GPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAG
: : .: ..:::.:.. : . .:. :::::.:::::. ..:. :::::.::....
CCDS58 TDVTGSIA-LAIGFSVAIGHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWVGPIIGA
170 180 190 200 210
240 250
pF1KE6 LLVGLLIRCFIGDGKTRLILKAR
.:.: :
CCDS58 VLAGGLYEYVFCPDVEFKRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILKPGVVHV
220 230 240 250 260 270
>>CCDS11889.1 AQP4 gene_id:361|Hs108|chr18 (323 aa)
initn: 383 init1: 211 opt: 395 Z-score: 499.1 bits: 100.3 E(32554): 1.8e-21
Smith-Waterman score: 395; 33.6% identity (68.2% similar) in 223 aa overlap (24-238:30-247)
10 20 30 40 50
pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVIE-N
: . : . .:.:. .:.... :.:. .
CCDS11 MSDRPTARRWGKCGPLCTRENIMVAFKGVWTQAFWKAVTAEFLAMLIFVLLSLGSTINWG
10 20 30 40 50 60
60 70 80 90 100
pF1KE6 GTDTGLLQPALAHGLALGLVIATL----GNISGGHFNPAVSLAAMLIGGLNLVMLLPYWV
::. : . .: .:: :::. :.:::::.::::..: . .... . : .
CCDS11 GTEKPLPVDMVLISLCFGLSIATMVQCFGHISGGHINPAVTVAMVCTRKISIAKSVFYIA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 SQLLGGMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAG-ALVAEIILTTLLALAVCM
.: ::...::.. :.: .. :. ::. . . .:: .:..:.:.: :....
CCDS11 AQCLGAIIGAGILYLVTPP----SVVGGLGVTMVHGNLTAGHGLLVELIITFQLVFTIFA
130 140 150 160 170
170 180 190 200 210 220
pF1KE6 GAINEKTK--GPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWL
. ...: : .: ..:::.:.. : . .:. :::::.:::::. ..:. :::::.
CCDS11 SCDSKRTDVTGSIA-LAIGFSVAIGHLFAINYTGASMNPARSFGPAVIMGNWENHWIYWV
180 190 200 210 220 230
230 240 250
pF1KE6 GPLLAGLLVGLLIRCFIGDGKTRLILKAR
::.....:.: :
CCDS11 GPIIGAVLAGGLYEYVFCPDVEFKRRFKEAFSKAAQQTKGSYMEVEDNRSQVETDDLILK
240 250 260 270 280 290
>>CCDS31798.1 AQP6 gene_id:363|Hs108|chr12 (282 aa)
initn: 208 init1: 208 opt: 373 Z-score: 472.3 bits: 95.1 E(32554): 5.5e-20
Smith-Waterman score: 373; 32.9% identity (67.1% similar) in 246 aa overlap (11-248:3-241)
10 20 30 40 50
pF1KE6 MCEPEFGNDKAREPSVGGR-WRVSWYERFVQPC----LVELLGSALFIFIGCLSVIENGT
: :: ::: : :. . ..:.:...:..:.: ::.. :
CCDS31 MDAVEP--GGRGWASMLACRLWKAISRALFAEFLATGLYVFFGVGSVMRWPT
10 20 30 40 50
60 70 80 90 100 110
pF1KE6 DT-GLLQPALAHGLALGLVIATLGNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQLLG
..:: :.. .:. .... . . ::.: ::::.:: .. . ..: . : ..::.:
CCDS31 ALPSVLQIAITFNLVTAMAVQVTWKASGAHANPAVTLAFLVGSHISLPRAVAYVAAQLVG
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE6 GMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAINEK
. .:::: .: : . . .. : .:... ... :...:..:: :.: : .. ...
CCDS31 ATVGAALLYGVMPGD-IRETLGIN--VVRNSVSTGQAVAVELLLTLQLVLCVFASTDSRQ
120 130 140 150 160
180 190 200 210 220 230
pF1KE6 TKGPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPLLAGLL
:.: : . ::..:.. : : .: :::::.::::.. .... ::..:.:::...::
CCDS31 TSGSPATM-IGISVALGHLIGIHFTGCSMNPARSFGPAIIIGKFTVHWVFWVGPLMGALL
170 180 190 200 210 220
240 250
pF1KE6 VGLLIRCFI--GDGKTRLILKAR
..: : :. : ::
CCDS31 ASL-IYNFVLFPDTKTLAQRLAILTGTVEVGTGAGAGAEPLKKESQPGSGAVEMESV
230 240 250 260 270 280
>>CCDS5431.1 AQP1 gene_id:358|Hs108|chr7 (269 aa)
initn: 354 init1: 180 opt: 346 Z-score: 438.7 bits: 88.8 E(32554): 4.1e-18
Smith-Waterman score: 346; 32.2% identity (65.2% similar) in 227 aa overlap (28-243:10-230)
10 20 30 40 50
pF1KE6 MCEPEFGNDKAREPSVGGRWRVSWYERFVQPCLVELLGSALFIFIGCLSVI----ENGTD
: . ..:.:...::.::. :.. :..
CCDS54 MASEFKKKLFWRAVVAEFLATTLFVFISIGSALGFKYPVGNN
10 20 30 40
60 70 80 90 100 110
pF1KE6 TGLLQPALAHGLALGLVIATL----GNISGGHFNPAVSLAAMLIGGLNLVMLLPYWVSQL
.: . .::.:: :::: :.:::.:.::::.:. .: ... : : ..:
CCDS54 QTAVQDNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQISIFRALMYIIAQC
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE6 LGGMLGAALAKAVSPEERFWNASGAAFVTVQEQGQVAGALVAEIILTTLLALAVCMGAIN
.:.....:. .... . . .. ..:: : ::: : : :..:. : .
CCDS54 VGAIVATAILSGITSSLTGNSLGRNDLADGVNSGQGLGI---EIIGT--LQLVLCVLATT
110 120 130 140 150
180 190 200 210 220
pF1KE6 EKTK---GPLAPFSIGFAVTVDILAGGPVSGGCMNPARAFGPAVVANHWNFHWIYWLGPL
.. . : ::..::..:.. : . .: .::::.:: ::...... :::.:.::.
CCDS54 DRRRRDLGGSAPLAIGLSVALGHLLAIDYTGCGINPARSFGSAVITHNFSNHWIFWVGPF
160 170 180 190 200 210
230 240 250
pF1KE6 LAGLLVGLLIRCFIGDGKTRLILKAR
..: :. .:: ::
CCDS54 IGGALA-VLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK
220 230 240 250 260
255 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 11:38:57 2016 done: Tue Nov 8 11:38:57 2016
Total Scan time: 1.510 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]