FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2611, 295 aa
1>>>pF1KE2611 295 - 295 aa - 295 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2220+/-0.000891; mu= 14.9927+/- 0.053
mean_var=57.1448+/-11.660, 0's: 0 Z-trim(105.3): 27 B-trim: 227 in 2/46
Lambda= 0.169662
statistics sampled from 8354 (8376) to 8354 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.626), E-opt: 0.2 (0.257), width: 16
Scan time: 2.070
The best scores are: opt bits E(32554)
CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 ( 295) 1929 480.4 6.8e-136
CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 ( 230) 1516 379.3 1.5e-105
CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 ( 301) 953 241.5 5.7e-64
CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 ( 292) 952 241.3 6.5e-64
CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 ( 342) 830 211.4 7.3e-55
CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 ( 256) 702 180.1 1.5e-45
CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 ( 257) 702 180.1 1.5e-45
CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 ( 216) 620 160.0 1.5e-39
>>CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 (295 aa)
initn: 1929 init1: 1929 opt: 1929 Z-score: 2553.2 bits: 480.4 E(32554): 6.8e-136
Smith-Waterman score: 1929; 99.7% identity (100.0% similar) in 295 aa overlap (1-295:1-295)
10 20 30 40 50 60
pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG
190 200 210 220 230 240
250 260 270 280 290
pF1KE2 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKYELSVIM
::::::::::::::::::::::::::::::::::::::.::::::::::::::::
CCDS10 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKTEQSEDKPEKYELSVIM
250 260 270 280 290
>>CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 (230 aa)
initn: 1516 init1: 1516 opt: 1516 Z-score: 2008.6 bits: 379.3 E(32554): 1.5e-105
Smith-Waterman score: 1516; 99.6% identity (100.0% similar) in 230 aa overlap (66-295:1-230)
40 50 60 70 80 90
pF1KE2 LIVLGCGCVAQAILSRGRFGGVITINVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFG
::::::::::::::::::::::::::::::
CCDS81 MAVAMAIYVAGGVSGGHINPAVSLAMCLFG
10 20 30
100 110 120 130 140 150
pF1KE2 RMKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 RMKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPY
40 50 60 70 80 90
160 170 180 190 200 210
pF1KE2 LSLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 LSLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAM
100 110 120 130 140 150
220 230 240 250 260 270
pF1KE2 NPARDLSPRLFTALAGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 NPARDLSPRLFTALAGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDS
160 170 180 190 200 210
280 290
pF1KE2 VFKAEQSEDKPEKYELSVIM
:::.::::::::::::::::
CCDS81 VFKTEQSEDKPEKYELSVIM
220 230
>>CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 (301 aa)
initn: 952 init1: 952 opt: 953 Z-score: 1262.0 bits: 241.5 E(32554): 5.7e-64
Smith-Waterman score: 953; 50.0% identity (80.1% similar) in 276 aa overlap (16-290:14-289)
10 20 30 40 50 60
pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI
: ..: ::.. :.::::.:.:..: : ::::. : :. .:.
CCDS10 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTM
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV
.. :.::..::::.:.:::.:.::: :::::. ::. : :::.:. .:.:.:: .....
CCDS10 FLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGAT
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF
. .:.:.:....::.: ..: . :: :::::::::::: :.: :::..: .:.. ..::.
CCDS10 YVLYHDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAIL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG
: :: :.: ::::...:.::.... :.: : : .::::::.::::: .:::: ::: ::
CCDS10 DRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSAG
180 190 200 210 220 230
250 260 270 280 290
pF1KE2 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPE-PDSVFKAEQSEDKPEKYELSVIM
:..::.:::.:::::..: : :.. .:::: :. . ... : . :
CCDS10 NGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLE
240 250 260 270 280 290
CCDS10 CKL
300
>>CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 (292 aa)
initn: 943 init1: 918 opt: 952 Z-score: 1260.9 bits: 241.3 E(32554): 6.5e-64
Smith-Waterman score: 952; 51.6% identity (82.2% similar) in 258 aa overlap (16-273:15-272)
10 20 30 40 50 60
pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI
: .. : ...:.: :::.::...::: :::..:::: :: .::
CCDS65 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTI
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV
:..:..::...: .:: :::.:.::::..:::...: :.:::.:. :: ::::.::. :
CCDS65 NLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF
::.:::.. :: ..:.. : :.:: ::::::. .:.. :.: :: ..: :.. :.::
CCDS65 FGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIV
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE2 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG
: : .::::: ...::...::..:.:.::: :.:::::..::::::::::: :: .:
CCDS65 DPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTTG
180 190 200 210 220 230
250 260 270 280 290
pF1KE2 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKYELSVIM
...::.:.:.::.:.. : ..: :.: : .:
CCDS65 QHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI
240 250 260 270 280 290
>>CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 (342 aa)
initn: 753 init1: 708 opt: 830 Z-score: 1098.4 bits: 211.4 E(32554): 7.3e-55
Smith-Waterman score: 830; 42.9% identity (77.7% similar) in 273 aa overlap (13-284:24-295)
10 20 30 40
pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAIL
: . .:. ....: :.::..:....:.: : ::. .:
CCDS65 MVQASGHRRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVL
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 SRGRFGGVITINVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQ
.. ..:. . .:.::...:.:...::: .::.:.: ::..: : .::. : :.: :: .:
CCDS65 NK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQ
70 80 90 100 110
110 120 130 140 150 160
pF1KE2 FLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVAT
:::.:..:::.....: ... :.::.:...: ::: ::::: ...: .: ... :
CCDS65 FLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLT
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 MILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTAL
.: . .::: :..: : : : ..::.:...:. :::.:.: :.::.::: ::.:: .
CCDS65 GMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFI
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 AGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHP-EPDSVFKAEQSEDKPEK
:::: .:: :.:.::.:::.::.:: .::.::.. : : :: .. . ::
CCDS65 AGWGKQVFSNGENWWWVPVVAPLLGAYLGGIIYLVFIGSTIPREPLKLEDSVAYEDHGIT
240 250 260 270 280 290
290
pF1KE2 YELSVIM
CCDS65 VLPKMGSHEPTISPLTPVSVSPANRSSVHPAPPLHESMALEHF
300 310 320 330 340
>>CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 (256 aa)
initn: 606 init1: 606 opt: 702 Z-score: 931.1 bits: 180.1 E(32554): 1.5e-45
Smith-Waterman score: 702; 41.5% identity (77.2% similar) in 241 aa overlap (13-253:23-256)
10 20 30 40 50
pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILS
: . .:. ....: :.::..:....:.: : ::. .:.
CCDS83 MGSGHCLRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVLN
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 RGRFGGVITINVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQF
. ..:. . .:.::...:.:...::: .::.:.: ::..: : .::. : :.: :: .::
CCDS83 K-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQF
70 80 90 100 110
120 130 140 150 160 170
pF1KE2 LGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATM
::.:..:::.....: ... :.::.:...: ::: ::::: ...: .: ... :
CCDS83 LGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 ILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALA
.: . .::: :..: : : : ..::.:...:. :::.:.: :.::.::: ::.:: .:
CCDS83 MLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 GWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKYE
::: .::: . : ::..
CCDS83 GWGKQVFR------YCPCPGPFL
240 250
>>CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 (257 aa)
initn: 606 init1: 606 opt: 702 Z-score: 931.1 bits: 180.1 E(32554): 1.5e-45
Smith-Waterman score: 702; 41.5% identity (77.2% similar) in 241 aa overlap (13-253:24-257)
10 20 30 40
pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAIL
: . .:. ....: :.::..:....:.: : ::. .:
CCDS83 MVQASGHRRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVL
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 SRGRFGGVITINVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQ
.. ..:. . .:.::...:.:...::: .::.:.: ::..: : .::. : :.: :: .:
CCDS83 NK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQ
70 80 90 100 110
110 120 130 140 150 160
pF1KE2 FLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVAT
:::.:..:::.....: ... :.::.:...: ::: ::::: ...: .: ... :
CCDS83 FLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLT
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 MILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTAL
.: . .::: :..: : : : ..::.:...:. :::.:.: :.::.::: ::.:: .
CCDS83 GMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFI
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 AGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKY
:::: .::: . : ::..
CCDS83 AGWGKQVFR------YCPCPGPFL
240 250
>>CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 (216 aa)
initn: 624 init1: 606 opt: 620 Z-score: 823.8 bits: 160.0 E(32554): 1.5e-39
Smith-Waterman score: 620; 41.9% identity (76.7% similar) in 215 aa overlap (48-258:2-215)
20 30 40 50 60 70
pF1KE2 LKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITINVGFSMAVAMAIYVAGG
.:.. ..:. . .:.::...:.:...:::
CCDS83 MVLNK-KYGSYLGVNLGFGFGVTMGVHVAGR
10 20 30
80 90 100 110 120 130
pF1KE2 VSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLL
.::.:.: ::..: : .::. : :.: :: .::::.:..:::.....: ... :.::.:.
CCDS83 ISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFLGSFLAAATIYSLFYTAILHFSGGQLM
40 50 60 70 80 90
140 150 160 170 180 190
pF1KE2 IVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIG
..: ::: ::::: ...: .: ... : .: . .::: :..: : : : ..::
CCDS83 VTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGMLQLCLFAITDQENNPALPGTEALVIG
100 110 120 130 140 150
200 210 220 230 240 250
pF1KE2 LLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAGN--NFWWI--PVVGPLV
.:...:. :::.:.: :.::.::: ::.:: .:::: .::: . .. :. :. .: .
CCDS83 ILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAGWGKQVFRWHHLPGLHWLHHPTGAPEI
160 170 180 190 200 210
260 270 280 290
pF1KE2 GAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKYELSVIM
:. :
CCDS83 GGFCGV
295 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 17:04:13 2016 done: Tue Nov 8 17:04:13 2016
Total Scan time: 2.070 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]