FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1784, 292 aa
1>>>pF1KE1784 292 - 292 aa - 292 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.8946+/-0.000788; mu= 17.1202+/- 0.047
mean_var=61.1771+/-12.501, 0's: 0 Z-trim(107.5): 37 B-trim: 0 in 0/50
Lambda= 0.163976
statistics sampled from 9586 (9615) to 9586 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.67), E-opt: 0.2 (0.295), width: 16
Scan time: 2.010
The best scores are: opt bits E(32554)
CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 ( 292) 1985 477.9 3.7e-135
CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 ( 295) 952 233.6 1.4e-61
CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 ( 301) 931 228.6 4.4e-60
CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 ( 342) 926 227.5 1.1e-59
CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 ( 230) 781 193.0 1.7e-49
CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 ( 256) 781 193.1 1.8e-49
CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 ( 257) 781 193.1 1.9e-49
CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 ( 216) 733 181.7 4.2e-46
>>CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 (292 aa)
initn: 1985 init1: 1985 opt: 1985 Z-score: 2539.9 bits: 477.9 E(32554): 3.7e-135
Smith-Waterman score: 1985; 100.0% identity (100.0% similar) in 292 aa overlap (1-292:1-292)
10 20 30 40 50 60
pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS65 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTIN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 LAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS65 LAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIVF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 GLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS65 GLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIVD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 PYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTTGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS65 PYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTTGQ
190 200 210 220 230 240
250 260 270 280 290
pF1KE1 HWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS65 HWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI
250 260 270 280 290
>>CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 (295 aa)
initn: 964 init1: 918 opt: 952 Z-score: 1219.2 bits: 233.6 E(32554): 1.4e-61
Smith-Waterman score: 952; 51.6% identity (82.2% similar) in 258 aa overlap (15-272:16-273)
10 20 30 40 50
pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTI
: .. : ...:.: :::.::...::: :::..:::: :: .::
CCDS10 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE1 NLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIV
:..:..::...: .:: :::.:.::::..:::...: :.:::.:. :: ::::.::. :
CCDS10 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE1 FGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIV
::.:::.. :: ..:.. : :.:: ::::::. .:.. :.: :: ..: :.. :.::
CCDS10 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE1 DPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTTG
: : .::::: ...::...::..:.:.::: :.:::::..::::::::::: :: .:
CCDS10 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE1 QHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI
...::.:.:.::.:.. : ..: :.: : .:
CCDS10 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKTEQSEDKPEKYELSVIM
250 260 270 280 290
>>CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 (301 aa)
initn: 978 init1: 918 opt: 931 Z-score: 1192.2 bits: 228.6 E(32554): 4.4e-60
Smith-Waterman score: 931; 50.2% identity (78.9% similar) in 279 aa overlap (14-289:11-284)
10 20 30 40 50
pF1KE1 MGRQKELVSRCGEMLHIRYR--LLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLT
: :.: : : :: ::: ::...:... :.:::.: : :.:.:.:
CCDS10 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFT
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 INLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGI
. :: ..:::..: ..:.::::::::: ..:::...: ::.::::: :.: :.:: ..:
CCDS10 MFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE1 VFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAI
.. ::.::. ... ..: :.::. ::.::::::. .:.. :::.:: .::. ::: .:::
CCDS10 TYVLYHDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE1 VDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTT
.: :. :: ::: .::...:..: ::: : : .:::::.:::::: .:::: ::..
CCDS10 LDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE1 GQHWWWVPIVSPLLGSIAGVFVYQLMIGCHL-EQPPPSNEEENVKLAHVKHKEQI
:. :::::.:.::.:. .:. .:::... : : : :... :. ..::
CCDS10 GNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQD-----LVSAQHKASELETPA
240 250 260 270 280 290
CCDS10 SAQMLECKL
300
>>CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 (342 aa)
initn: 929 init1: 818 opt: 926 Z-score: 1185.0 bits: 227.5 E(32554): 1.1e-59
Smith-Waterman score: 926; 47.2% identity (80.9% similar) in 267 aa overlap (7-273:21-284)
10 20 30 40
pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQV
.... :.:. ...:. ::: ..: ....:: ::::..
CCDS65 MVQASGHRRSTRGSKMVSWSVIAKIQEILQ--RKMVREFLAEFMSTYVMMVFGLGSVAHM
10 20 30 40 50
50 60 70 80 90 100
pF1KE1 VLSRGTHGGFLTINLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTL
::.. .:..: .::.:::.::.:. .::..::::.: ::::: : :.: :: :.:.:.:
CCDS65 VLNK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVL
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE1 AQTLGAFLGAGIVFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFI
.: ::.::.:. ...:.: :: ::. .::.:.:: .:::::::: :. . ::...
CCDS65 GQFLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAW
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 GTASLIVCVLAIVDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFT
:. : .:..::.: :::. : ::...:..:..::.:.:.:.:::.::.::. ::.::
CCDS65 LTGMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFT
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 ALAGWGSAVFTTGQHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHV
.::::. ::..:..:::::.:.::::. : ..: ..:: . . :
CCDS65 FIAGWGKQVFSNGENWWWVPVVAPLLGAYLGGIIYLVFIGSTIPREPLKLEDSVAYEDHG
240 250 260 270 280 290
290
pF1KE1 KHKEQI
CCDS65 ITVLPKMGSHEPTISPLTPVSVSPANRSSVHPAPPLHESMALEHF
300 310 320 330 340
>>CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 (230 aa)
initn: 792 init1: 768 opt: 781 Z-score: 1002.1 bits: 193.0 E(32554): 1.7e-49
Smith-Waterman score: 781; 52.2% identity (82.1% similar) in 207 aa overlap (66-272:2-208)
40 50 60 70 80 90
pF1KE1 VMFGCGSVAQVVLSRGTHGGFLTINLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAR
::...: .:: :::.:.::::..:::...:
CCDS81 MAVAMAIYVAGGVSGGHINPAVSLAMCLFGR
10 20 30
100 110 120 130 140 150
pF1KE1 EPWIKLPIYTLAQTLGAFLGAGIVFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHL
:.:::.:. :: ::::.::. :::.:::.. :: ..:.. : :.:: ::::::. .:
CCDS81 MKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYL
40 50 60 70 80 90
160 170 180 190 200 210
pF1KE1 DMINGFFDQFIGTASLIVCVLAIVDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVN
.. :.: :: ..: :.. :.:: : : .::::: ...::...::..:.:.::: :.:
CCDS81 SLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMN
100 110 120 130 140 150
220 230 240 250 260 270
pF1KE1 PARDFGPRLFTALAGWGSAVFTTGQHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPS
::::..::::::::::: :: .:...::.:.:.::.:.. : ..: :.: : .:
CCDS81 PARDLSPRLFTALAGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSV
160 170 180 190 200 210
280 290
pF1KE1 NEEENVKLAHVKHKEQI
CCDS81 FKTEQSEDKPEKYELSVIM
220 230
>>CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 (256 aa)
initn: 763 init1: 694 opt: 781 Z-score: 1001.4 bits: 193.1 E(32554): 1.8e-49
Smith-Waterman score: 781; 47.8% identity (81.3% similar) in 230 aa overlap (7-236:20-246)
10 20 30 40
pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVV
.... :.:. ...:. ::: ..: ....:: ::::..:
CCDS83 MGSGHCLRSTRGSKMVSWSVIAKIQEILQ--RKMVREFLAEFMSTYVMMVFGLGSVAHMV
10 20 30 40 50
50 60 70 80 90 100
pF1KE1 LSRGTHGGFLTINLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLA
:.. .:..: .::.:::.::.:. .::..::::.: ::::: : :.: :: :.:.:.:.
CCDS83 LNK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLG
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE1 QTLGAFLGAGIVFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIG
: ::.::.:. ...:.: :: ::. .::.:.:: .:::::::: :. . ::...
CCDS83 QFLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWL
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 TASLIVCVLAIVDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTA
:. : .:..::.: :::. : ::...:..:..::.:.:.:.:::.::.::. ::.::
CCDS83 TGMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTF
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 LAGWGSAVFTTGQHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVK
.::::. ::
CCDS83 IAGWGKQVFRYCPCPGPFL
240 250
>>CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 (257 aa)
initn: 763 init1: 694 opt: 781 Z-score: 1001.4 bits: 193.1 E(32554): 1.9e-49
Smith-Waterman score: 781; 47.8% identity (81.3% similar) in 230 aa overlap (7-236:21-247)
10 20 30 40
pF1KE1 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQV
.... :.:. ...:. ::: ..: ....:: ::::..
CCDS83 MVQASGHRRSTRGSKMVSWSVIAKIQEILQ--RKMVREFLAEFMSTYVMMVFGLGSVAHM
10 20 30 40 50
50 60 70 80 90 100
pF1KE1 VLSRGTHGGFLTINLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTL
::.. .:..: .::.:::.::.:. .::..::::.: ::::: : :.: :: :.:.:.:
CCDS83 VLNK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVL
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE1 AQTLGAFLGAGIVFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFI
.: ::.::.:. ...:.: :: ::. .::.:.:: .:::::::: :. . ::...
CCDS83 GQFLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAW
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 GTASLIVCVLAIVDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFT
:. : .:..::.: :::. : ::...:..:..::.:.:.:.:::.::.::. ::.::
CCDS83 LTGMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFT
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 ALAGWGSAVFTTGQHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHV
.::::. ::
CCDS83 FIAGWGKQVFRYCPCPGPFL
240 250
>>CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 (216 aa)
initn: 737 init1: 694 opt: 733 Z-score: 941.1 bits: 181.7 E(32554): 4.2e-46
Smith-Waterman score: 733; 48.4% identity (77.9% similar) in 217 aa overlap (46-258:1-216)
20 30 40 50 60 70
pF1KE1 HIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTINLAFGFAVTLGILIAG
.::.. .:..: .::.:::.::.:. .::
CCDS83 MVLNK-KYGSYLGVNLGFGFGVTMGVHVAG
10 20
80 90 100 110 120 130
pF1KE1 QVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIVFGLYYDAIWHFADNQL
..::::.: ::::: : :.: :: :.:.:.:.: ::.::.:. ...:.: :: ::. .::
CCDS83 RISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFLGSFLAAATIYSLFYTAILHFSGGQL
30 40 50 60 70 80
140 150 160 170 180 190
pF1KE1 FVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIVDPYNNPVPRGLEAFTV
.:.:: .:::::::: :. . ::... :. : .:..::.: :::. : ::...
CCDS83 MVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGMLQLCLFAITDQENNPALPGTEALVI
90 100 110 120 130 140
200 210 220 230 240 250
pF1KE1 GLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFT----TGQHWWWVPIVSPL
:..:..::.:.:.:.:::.::.::. ::.:: .::::. :: : :: : .:
CCDS83 GILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAGWGKQVFRWHHLPGLHWLHHPTGAPE
150 160 170 180 190 200
260 270 280 290
pF1KE1 LGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI
.:.. ::
CCDS83 IGGFCGV
210
292 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 15:47:07 2016 done: Sun Nov 6 15:47:07 2016
Total Scan time: 2.010 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]